Hipótesis del ADN basura: Podar pequeños pesos preentrenados de manera irreversible y monótona perjudica las tareas posteriores "difíciles" en los LLMs
La poda irreversible de pesos pequeños perjudica las tareas más difíciles en LLMs. Conoce el impacto en el rendimiento del modelo.